بررسی و مقایسه روش های انطباق و بهبود پرس وجو برای موتورهای جستجو در محیط وب

پایان نامه
چکیده

پرس وجوهای مبهم و کوتاه ارسالی به موتور جستجوها، به بازیابی نتایج غیرمرتبط منجر می شود. روش های انطباق پرس وجو سعی می کنند تا پرس وجوها را ابهام زدایی کنند و پرس وجو را با نیازهای اطلاعاتی کاربر منطبق کنند. بسط پرس وجو یکی از روش های انطباق پرس وجو است که سعی دارد کلمات مرتبطی را به پرس¬وجو اضافه کند، که می توان کلمات بسط را به صورت محلی و سراسری انتخاب کرد. بسط پرس وجو معمولا کارایی سامانه های بازیابی اطلاعات را افزایش می¬دهد. بازخورد مرتبط (rf) و بازخورد شبه مرتبط (prf) روش های بسط پرس وجو هستند که به ترتیب از اطلاعات بازخورد کاربر و اسناد رتبه بالا در نتایج اولیه استفاده می کنند تا کلماتی مرتبط را به پرس وجو اضافه کنند. راه کارهای محلی برای بسط پرس وجو، از اسناد رتبه بالای نتایج اولیه در روش بازخورد شبه مرتبط استفاده می کنند، که به بهبود کارایی سامانه ی جستجو کمک می کند. راه کار خوشه بندی لی و کرافت سعی می کند تا از هم پوشانی خوشه های ساخته شده با الگوریتم knn، برای انتخاب اسناد مرتبط استفاده کند. راه کار پیشنهادی ما، از الگوریتم knn برای خوشه بندی اسناد نتایج اولیه استفاده می کند. برای رسیدن به خوشه های بهتر، از شباهت حساس به پرس وجو استفاده کرده¬ایم. اعضای خوشه ها رتبه بندی شده و خوشه ها نسبت به هم رتبه بندی می شوند تا بتوانیم اسناد بهتر را از خوشه های رتبه بالا انتخاب کنیم. اسناد مرتبط انتخاب شده با هم ترکیب می شوند و کلمات بسط از سند ترکیبی با تابع رتبه¬بندی tf-idf انتخاب می شوند. کلمات انتخاب شده به پرس وجو اضافه می شوند تا بازیابی با پرس وجو بسط-داده شده انجام گیرد. برای ارزیابی راه کار ارائه شده از مجموعه داده ی پزشکی med استفاده کرده ایم. نتایج آزمایشات نشان می دهد که راه کار پیشنهادی، کارایی را نسبت به بازیابی پایه vsm و بازخورد شبه مرتبط بهبود می دهد. کارایی با خوشه های ساخته شده با شباهت حساس به پرس وجو نسبت به شباهت مبتنی بر کلمه افزایش پیدا کرده است که نشان از موثر بودن شباهت حساس به پرس وجو در خوشه بندی اسناد نتایج اولیه دارد

منابع مشابه

مقایسه تأثیر وضعیت طاق باز و دمر بر وضعیت تنفسی نوزادان نارس مبتلا به سندرم دیسترس تنفسی حاد تحت درمان با پروتکل Insure

کچ ی هد پ ی ش مز ی هن ه و فد : ساسا د مردنس رد نامرد ي سفنت سرتس ي ظنت نادازون داح ي سکا لدابت م ي و نژ د ي سکا ي د هدوب نبرک تسا طسوت هک کبس اـه ي ناـمرد ي فلتخم ي هلمجزا لکتورپ INSURE ماجنا م ي دوش ا اذل . ي هعلاطم ن فدهاب اقم ي هس عضو ي ت اه ي ندب ي عضو رب رمد و زاب قاط ي سفنت ت ي هـب لاتـبم سراـن نادازون ردنس د م ي سفنت سرتس ي لکتورپ اب نامرد تحت داح INSURE ماجنا درگ ...

متن کامل

موتورهای جستجو در اینترنت

شاید تاکنون در مورد اینترنت و موتورهای جستجوگر مطالب زیادی شنیده و خوانده باشید. ما در اینجا سعی در معرفی مجدد تعدادی از آنها بصورتی بسیار فشرده و مختصر داریم تا در زمان کمتر بتوانید به اطلاعات مورد نیاز خود برسید. همچنین سعی می کنیم به معرفی تعدادی از سایتهای اطلاعاتی با کاربری بالا بپردازیم.

متن کامل

بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو

بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه تبریز - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023